بررسی همکاری در یادگیری در ربات های جابجاکننده اجسام

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تهران
نویسنده مسعود اسدپور
استاد راهنما مجید نیلی احمدآبادی
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1378

چکیده

همکاری در یادگیری در یک سیستم چند عاملی می تواند باعث افزایش سرعت یادگیری و هماهنگی با محیط پیچیده و متغیر گردد. این افزایش سرعت یادگیری به شرط شناخت صحیح افراد خبره در گروه و استفاده مناسب از تجربیات همه عاملها امکان پذیر است . در تحقیقاتی که تاکنون انجام شده است ، شناخت خبره براساس یک معیار ساده و یا با فرض ثابت بودن میزان خبرگی نسبی رباتها بوده است . در این تحقیق با توجه به توصیفات سیستم چند عاملی ، چند معیار مختلف برای درجه بندی میزان خبرگی عوامل معرفی شده است . همچنین براساس معیارهای استفاده شده ، روش جدید اشتراک وزن دار استراتژی برای استفاده هر ربات از دانش دیگر عوامل گروه معرفی می گردد. در این روش ، عاملهای گروه در دو حالت یادگیری مستقل و یادگیری با همکاری آموزش می بینند. یادگیری مستقل عاملها براساس یادگیری تقویتی q - learning صورت می گیرد. پس از چند تلاش یادگیری مستقل ، همکاری در یادگیری آغاز می گردد و دانش یادگیری شده میان عاملها مبادله می گردد. در این مرحله هر عامل به دانش عاملهای دیگر براساس میزان خبرگی آنها وزن مناسب اختصاص داده و در دانش خود تاثیر می دهد. تعیین وزنها براساس میزان خبرگی عاملها وبا یکی از سه فرمول ارائه شده (1) یادگیری از همه ، (2) یادگیری از همه با وزن های مثبت و(3) یادگیری از افراد خبره صورت می گیرد. روشهای تعیین وزنها و معیارهای معرفی شده برای درجه بندی میزان خبرگی عوامل برروی سه بستر تست (هدف و هدف یاب ، بلند کردن اجسام دو بعدی و هل دادن اجسام ) بررسی شده و نتایج با یادگیری مستقل عوامل و روشهای ارائه شده در تحقیقات قبلی مقایسه می شود.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

متن کامل

طراحی کارگیرش اجسام توسط ربات های همکار

کارگیرش در رباتیک، اولین مرحله از فرآیند جابجایی اجسام است، که به بررسی ارتباط میان مجری نهایی ربات و جسم گرفته شده می پردازد. این پژوهش با مقدمه ای از موضوع کارگیرش در رباتیک آغاز و پس از ارائه یک تصویر کلی از موضوعات چهار دهه گذشته در کارگیرش رباتیک به ارائه روندی برای برنامه ریزی کارگیرش بازوهای رباتیک می پردازد. شاخص عملکردی چندجنبه ای کارگیرش، mag، بعنوان اولین شاخص ارزیابی کارگیرش در زمی...

15 صفحه اول

ربات های کاوشگر در سیاره سرخ

سال هاست که ایده مسکونی شدن کرات دیگر و اعزام انسان به فضا به طور جدی پیگیری می شود. دانشمندان تلاش های زیادی را در راستای کشف آثار حیات در سایر کرات و انتخاب مکان مناسب برای زندگی انسان ها در فضا انجام داده اند. به گزارش سرویس آی تی و فناوری انتخاب، ایلان ماسک، مدیرعامل پروژه اسپیس ایکیس و از چهره های سرشناس عرصة فضانوردی، اخیراً در حال کار برای راه‌اندازی یک پایگاه در مریخ تا پیش از سال ...

متن کامل

Degenerate Four Wave Mixing in Photonic Crystal Fibers

In this study, Four Wave Mixing (FWM) characteristics in photonic crystal fibers are investigated. The effect of channel spacing, phase mismatching, and fiber length on FWM efficiency have been studied. The variation of idler frequency which obtained by this technique with pumping and signal wavelengths has been discussed. The effect of fiber dispersion has been taken into account; we obtain th...

متن کامل

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تهران

کلمات کلیدی

یادگیری روبات شبیه سازی همکاری در یادگیری سیستم یادگیری چند عاملی

میزبانی شده توسط پلتفرم ابری doprax.com